分析单细胞转录组测序的软件和方法有很多,最流行的莫过于Seurat包,可以完成单细胞分析整个流程,我们整个教程也是基于R语言Seurat包来实现的,所以首先安装包:
BiocManager::install("Seurat")library(Seurat)单细胞文件形式各式各样,但是最终分析需要的目的文件是一个矩阵,行位基因,列为细胞。这里我们介绍几种常见的文件形式,将他们读入R,并构建可以后续处理的Seurat对象。
1、10X单细胞测序文件
这应该是最常见的,一般10X下机。经过前期处理后,我们拿到手的可有用于后续分析的文件包含三个,第一个是barcode文件,一个是gene文件,一个是matrix文件。10X单细胞测序,公共数据库上传的数据也会包含这三个文件。使用Read10X函数读入文件,三个文件包含在同一文件夹,需要注意的是要将feature那个文件命名为genes。
先下载Cell文章(从Cell学单细胞转录组分析(一):开端!!!)中的数据。因为原文有很多样本,这里我们只下载6例作为演示。GEO数据库检索下载。
每个样本包含三个文件,这是标准的10X文件。解压文件,每个样本新建一个文件夹。
setwd("F:/生物信息学/cell单细胞")GM1